机器学习和深度学习入门总结
本菜鸟入门机器学习也有一段时间了,有那么一丢丢的感悟,在这里做一点总结。介绍一下机器学习理论和实践的学习心得。
相关教材
数学基础
高数、线性代数这就没啥好说的,就是大学工科的必修科目。
统计机器学习
李航的蓝皮书和周志华的西瓜书可以说是国内的比较经典的教材,这两位也是国内人工智能领域的领军人物。
深度学习
强烈推荐花书,这可以说是深度学习方面的权威教材。除此以外还有吴恩达的讲义和教学视频,网上都可以找到。
小白入门教材
前面推荐的书籍,虽然算得上入门教材,但可能对于小白来说,不是很容易接受。这里推荐深度学习入门:基于Python的理论与实现和机器学习实战这两本书,讲的通俗易懂,容易上手。
进阶教材
PRML和MLAPP这两本书属于神书级别的,谁看谁知道。
补充资料
直接在github上搜索机器学习或深度学习关键词,就可以找到很多高星项目,我就不一一列举了。
实践部分
- 编程语言推荐python,简单容易上手。现在官方文档还推出了中文:https://docs.python.org/zh-cn/3/
- 机器学习方面,python中有三个很重要的包:numpy、pandas、matplot。具体的使用方法请查阅相应的官方文档:https://www.numpy.org/devdocs/
https://pandas.pydata.org/pandas-docs/stable/ https://matplotlib.org/index.html
这三个包暂时没有官方中文,但是有一些民间的汉化版本,大家可以自行百度。 - sklearn,这个包集成几乎所有统计机器学习的API,是一个很重要的工具包。官方网站:http://scikit-learn.github.io/stable
- pytorch,一个深度学习的框架,当然现在深度学习的框架很多,例如:tensorflow、keras等。但是pytorch是比较容易上手的。官方地址:https://pytorch.org/
- 还有一些包是根据具体的任务来使用的,例如做nlp常需要用到nltk、jieba等包,这种情况我就不细讲了。
论文
教材上的东西都比较滞后,学术前沿还是在论文上,机器学习这一块更新换代的特别快,大家还是得多读一读最新的论文,才能了解到最新的算法和模型。
感悟
做机器学习,很多时候就是在调包和调参,虽然我们这样吐槽,但实际上很多人连调包都不会。使用这些包,需要我们花费大量的时间来阅读文档、熟悉API参数,这样才能写出比较好的程序。除此以外,我们还需要多阅读论文,从而进行一点模型上的创新。